По мере того, как число пользователей социальных сетей растет, создание и распространение информации увеличиваются каждый день в огромных масштабах. Люди могут делиться своими идеями и мнениями на этих платформах. Сайт микроблогов в социальных сетях, таких как Facebook или Twitter, является предпочтительным средством обсуждения любого важного события, и информация передается немедленно. Это приводит к быстрому распространению слухов и распространению неточной информации, что вызывает у людей беспокойство. Поэтому важно оценить и подтвердить уровень достоверности такой информации. Из-за сложности текста автоматическое обнаружение слухов на ранних стадиях затруднительно. В данном исследовании используются различные методы NLP для извлечения информации из твитов, а затем применяются различные модели машинного обучения, чтобы определить, является ли информация слухом. Классификация выполняется с использованием трех классификаторов, таких как SVC (Support Vector Classifier), Gradient Boosting и классификаторы Naive Bayes для пяти различных событий из набора данных PHEME. Существуют некоторые недостатки: ограниченная обработка несбалансированных данных, трудность улавливания сложных лингвистических шаблонов, отсутствие интерпретируемости, сложности с обработкой больших пространств признаков и нечувствительность к порядку слов и контексту при использовании вышеуказанных классификаторов. Подход суммирования используется для преодоления вышеуказанных недостатков, при котором выходные данные комбинированных классификаторов представляют собой ансамбль с LSTM. Была проанализирована производительность моделей. Экспериментальные результаты показывают, что ансамблевая модель дает эффективные результаты по сравнению с другими классификаторами с точностью 93,59%.
Разработан подход для сравнительного анализа коллекций научных журналов на основе анализа графа соавторств и модели текста. Использование временных рядов метрик графа соавторства позволило провести анализ тенденций в развитии коллабораций авторов журнала. Модель текста была построена с помощью методов машинного обучения. При помощи модели текста была произведена классификация контента журналов для выявления степени аутентичности различных журналов и различных выпусков одного журнала. Разработана метрика Коэффициент контентной аутентичности, позволяющая количественно оценивать аутентичность коллекций журналов в сравнении. Сравнительный тематический анализ коллекций журналов выполнен с использованием тематической модели с аддитивной регуляризацией. На основании созданной тематической модели авторами построены тематические профили архивов журналов в едином тематическом базисе. Разработанный подход был применен к архивам двух журналов по тематике Ревматология за период 2000 – 2018 гг. В качестве эталона для сравнения метрик соавторств были взяты публичные наборы данных научной лаборатории SNAP Стендфордского университета. Проведено сравнение коллабораций соавторов журналов по тематике Ревматология с эталонными коллаборациями авторов. Произведено количественное сопоставление больших объемов текстов и метаданных научных статей. В результате проведенного авторами эксперимента с использованием разработанных методик показано, что контентная аутентичность выбранных журналов составляет 89%, соавторства в одном из журналов имеют ярко выраженную центральность, что является отличительной чертой редакционной политики. Наглядность и непротиворечивость полученных результатов подтверждает эффективность предложенного подхода. Разработанный в ходе эксперимента код на языке программирования Python может быть применен для сравнительного анализа других коллекций журналов на русском языке.
В статье представлен обзор прототипов интеллектуальных пространств, предназначенных для поддержки проведения научно-образовательных мероприятий и оснащенных средствами автоматической записи выступлений участников. На основе анализа применяемых в них средств обработки аудиовизуальных сигналов и реализованных пользовательских сервисов была предложена оригинальная классификация прототипов интеллектуальных пространств. Также описана специфика разработанного интеллектуального зала и его отличия от рассмотренных прототипов.
В статье описаны и проанализированы общие тенденции архитектурного проектирования, технологии, свойства и недостатки систем позиционирования в помещениях, основанных на использовании телекоммуникационных технологий (WI-FI, GSM, Bluetooth), которые поддерживаются современными смартфонами. Преимущество использования этих технологий состоит в том, что они позволяют разрабатывать мобильные системы, реализующие позиционирование внутри помещений, и не требуют закупки дополнительного оборудования. Например, музеи вместо того, чтобы приобретать дорогие аудиогиды, могут обеспечить посетителей программным обеспечением для их смартфонов, которое выполняет функции позиционирования, навигации и обеспечения пользователя информацией. В статье представлен сравнительный анализ наиболее перспективных на данный момент систем и решений.
Проводится анализ генераторов компиляторов LLgen и ACCENT на основе тестирования по заданным примерам для вывода об их применимости. Содержатся таблицы характеристик мало известных генераторов компиляторов и их Интернет-адреса.
Для многокритериальной оценки базовых топологических структур и фрактальных архитектур интегрированных GRID-систем и телекоммуникационных сетей обоснованы и формализованы основные показатели качества. Описаны результаты сравнительного анализа фрактальных и мультифрактальных архитектур распределенных GRID-систем по критериям надежности, стоимости и пропускной способности.
1 - 6 из 6 результатов